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摘要 :【 目 的】 在 全 基因 组 水 平 鉴定 中 华 按 虹 Anopheles sinensis 化 学 感受 蛋白 (chemosensory protein, 
CSP) 家 族 基 因 ,预测 该 家 族 基 因 的 特征 ,研究 代表 性 双 起 目 昆 忠 CSP 基因 的 系统 发 育 和 进化 。【 方 
法 】 在 NCBI 数 据 库 中 下 载 CSP 氨基 酸 序列 作为 询问 序列 ,通过 Blast fe HMM 方法 在 全 基因 组 水 平 
搜索 和 鉴定 中 华 按 明 、 冈 比 亚 Xi An. gambiae, 3X A 4 3 Aedes aegypti ^e X q& JE 3X Culex 
quinquefasciatus 的 CSP RA AATA iub qs. TAN P Ee CSP 家 族 基 因 的 特性 
(基因 结构 基因 组 定位 、 剪 切 模 式 、 Ka/Ks aen 保守 结构 域 和 蛋白质 结构 等 ;通过 MEGA 软件 用 
最 大 似 然 法 (maximum likelihood, ML) 推断 该 家 族 基 因 的 系统 发 育 。【 结 果 】 中 华 按 归 、 冈 比 亚 按 
A. RAFS e S PEE SUE ZR 3I 8,8, 43 和 27 个 CSP 家 族 基 因 。 中 华 按 虹 CSP 家 族 基 因 
( AsCSPs ) 都 有 全 长 的 转录 组 序列 ,编码 116(AsCSP7) ~335(AsCSP5) 个 氨基 酸 ;7 个 AsCSPs 分 布 于 
Scaffold51 上 ,AsCSP8 分 布 于 Scaffold116;AsCSPl1 ~ AsCSP8 分 别 有 3, 2,1,1,1,2,1 和 2 个 选择 
性 剪 切 模式 ;4sCSP3 的 表达 量 最 高 ,其 FPKM 值 达到 385.46。AsCSPs 的 N 354a 5 Akt 17 ~37 个 
氨基 酸 组 成 , 均 含 有 4 个 保守 的 半 胱 氨 酸 位 点 (CYS68，CYS75，CYS94 和 CYS97) ,这些 位 点 界定 
了 两 个 二 硫 键 (CYS68-CYS75 和 CYS94-CYS97 ) 。 系 统 发 育 分 析 结 果 显 示 ,4 fo Ea S^ CSP E 
因 各 自 形成 明显 的 支 系 ,被 命名 为 组 CSPI ~ CSP8 (CSP1 - CSP8 group), 2& A f£ 3x e SC B 4 
别 有 35 和 18 个 CSP 基因 形成 了 一 个 不 为 按 蚂 所 共有 的 特殊 支 系 , 被 命名 为 Culicinae-specific 组 。 
蔡 换 率 结 果 显 示 , 中 华 按 蚂 与 冈比亚 按 蚂 同 源 基 因 对 的 Ka/Ks 值 都 小 于 1 ,说 明 CSP 家 族 基 因 在 进 
化 过 程 中 主要 是 受到 纯化 选择 作用 。 【结论 】 本 研究 为 蚊虫 ,特别 是 中 华 按 蚊 基 因 组 CSP 家 族 基因 
提供 了 信息 框架 ,为 进一步 开展 该 家 族 基 因 的 功能 研究 疯 定 了 基础 。 
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Abstract. [ Aim] The study aims to identify the genes of the chemosensory protein ( CSP) family in 
Anopheles sinensis whole-genome, to predict the characteristics of these CSP genes, and to investigate the 
phylogenetics and evolution of the CSPs in representative dipteran species. [ Methods] We searched, 
identified and named the CSP genes in An. sinensis, An. gambiae, Aedes aegypti and Culex 


quinquefasciatus genomes with Blast and HMM methods using CSP amino acid sequences downloaded from 
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NCBI database as inquiry entry, analyzed the characteristics of the CSP genes in An. sinensis using 
bioinformatics methods, including the structure, location, splicing and Ka/Ks ratio of these genes, 
conservative domains and protein structures, and deduced the phylogeny of CSP genes using maximum 
likelihood ( ML) method with MEGA software. [Results] The genomes of An. sinensis, An. gambiae, 
Ae. aegypti and Cx. quinquefasciatus contain 8, 8, 43 and 27 CSP genes, respectively. The CSP genes 
identified in An. sinensis ( AsCSPs) are all supported by full-length transcripts, encoding 116 ( AsCSP7) 
to 335 ( AsCSP5) amino acids. Out of them, seven AsCSPs are located on Scaffold 51 and AsCSP8 on 
Scaffoldl116. AsCSP1 — AsCSP8 possess 3, 2, 1, 1, 1, 2, 1 and 2 splicing variants, respectively, and 
AsCSP3 shows the highest expression level with a FPKM value of 385. 46. All AsCSPs each has a N- 
terminal signal peptide consisting of 17 — 37 amino acids, and contains 4 conserved cysteine sites 
(CYS68, CYS75, CYS94 and CYS97) , which define two disulfide bonds ( CYS68-CYS75 and CYS94- 
CYS97). Phylogenetic analysis results showed that eight CSP genes in four mosquito species are each 
grouped into a significant clade, and were named as CSPI - CSP8 group, respectively. Thirty-five and 18 
CSP genes in Ae. aegypti and Cx. quinquefasciatus , respectively, are grouped into a special clade without 
homologous genes with Anopheles species, and was named as the Culicinae-specific group in this study. 
The Ka/Ks values of orthologous gene pairs between An. sinensis and An. gambiae were all less than 1, 
suggesting that the CSP gene family mainly experienced purifying selection. during evolution. 
[Conclusion] The study provides an information frame of the CSP gene family in mosquito species, 
especially An. sinensis, and lays the foundation for further functional analysis of these genes. 
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E te IB E ERE HUE S ERMA 
境 各 种 信号 物质 刺激 的 嗅觉 感受 系统 ,通过 这 和 套 感 
受 系 统 ,昆虫 可 识别 来 目 种 内 、 种 间 和 外 界 环 境 的 各 
种 复杂 化 学 信息 ,再 将 这 些 信 息 转 换 成 体内 的 电子 
言 守 传 达到 中 枢 神 经 系统 ,从 而 使 昆虫 判断 出 食物 、 
天 敌 和 同伴 并 引起 取 食 . 趋 避 、 栖 境 选 择 及 “社会 ” 
交往 .求偶 行为 等 一 系列 行为 反应 (Sanchez-Cracia 
et al., 2009; Pelletier and Leal, 2011; Gu et al., 
2012), Eh B EE IRAE ENBERE ĠO, 
内 部 的 水 溶 状 淋巴 液 中 温润 着 双 癌 感觉 神经 元 ,还 
包括 2 Xk TG TE SR H: CUR 2 Er REI (odorant 
binding protein, OBP) PML FIR ZE H (chemosensory 
protein, CSP) ( Monteforti et al., 2002; Z> I% E, 
2014), 5j OBPs 不 同 的 是 ,CSP 家 族 基 因 主 要 结合 
和 运载 非 挥发 性 的 气味 分 子 和 化 学 刺激 物 (Ban et 
al., 2002) 。 从 CSP 的 研究 历程 来 看 ,其 命名 并 未 统 
一 。 起 初 因 其 在 触角 中 优先 表达 被 称 为 噢 党 特异 - 
D 4E F4 Ji ( olfactory-specific-D proteins, OS-D) 或 信 
FARBE A-10 (pheromone-binding proteins A- 
10) (McKenna et al., 1994; Pikielny et al., 1994) ,后 
XA BU AO Ai D] FE — E Bb rf, rp BU Js EC P C AUI 
下 层 须 和 是 等 ) 也 有 表达 ,将 其 称 为 感受 副官 蛋 日 
( sensory appendage protein, SAP) (Robertson et al., 























1999; Angeli et al., 1999) 。 实 际 上 ,它们 具有 相同 
FMA B (cysteine pattern, “CSP” motif), 
属于 同一 类 基因 , E EET Ww T ZR R Am HK 
ATENE E Wi P 3 — 28 R S E EIL (Forêt et al., 
2007) ,可 作为 气味 分 子 和 化 学 信和 号 刺激 物 的 载体 
集 日 ,并 将 其 转运 到 感受 冀 树 突 膜 上 的 受 体位 点 ,使 
之 与 受 体 集 日 结合 。 因 此 ,当前 这 类 和 蛋白 统称 为 化 
学 感受 重 白 (CSP) (Schneider, 1969; Pelosi et al., 
2005, 2006; Pelletier and Leal, 2011; lovinella et 
al., 2013) , 

H Pikielny 5: (1994) 在 果 蝇 Drosophila 的 触角 
中 首次 发 现 CSP 家 族 基 因 以 来 ,CSP 被 发 现存 在 于 
各 类 昆虫 中 ,其 基因 数量 在 各 物种 中 差异 很 大 ,在 黑 
fd SR D. melanogaster 中 仅 有 4 个 ,而 在 埃及 伊 蚊 
中 达到 43 个 (Pelletier and Leal, 2011; Vieira and 
Rozas, 2011; Andersson et al., 2013; Iovinella et al., 
2013; Dippel et al., 2014; Wang et al., 2015) , fifa 
发 现 CSP 类 重 日 是 一 类 相对 分 子 质 量 都 较 小 的 可 
浴 性 结合 集 日 质 , 具 有 4 个 保守 的 半 胱 氨 酸 位 点 , 构 
成 两 个 二 硫 键 (C1-C2 和 C3-C4), 具 有 6 个 a 螺旋 
( Briand et al., 2002; Li et al., 2003; Wanner et al., 
2004) 。 早 期 的 研究 指出 ,CSP EHEER Ar A P 
参与 结合 转运 外 界 气 味 分 子 和 化 学 信号 刺激 物 
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(Jacquin-Joly et al., 2001; Lartigue et al., 2002; 
Ozaki et al., 2005) ,但 随后 也 有 大 量 人 研究 表明 CSP 
在 一 些 非 感官 组 织 中 有 表达 ,反映 出 CSPs TESI Ee 
让 生长 发 育 (Wanner et al., 2005) Hf f R B (Forêt 
et al., 2007 ; Maleszka et al., 2007) 、 生理 节律 (Ozaki 
et al., 2005) X f£ 2s 2j Wa] p ( Sabatier et al., 2003; 
Jin et al., 2005) 等 方面 有 重要 的 生理 功能 。 

随 着 新 一 代 测 序 技术 的 广泛 应 用 , 越 来 越 多 的 
物种 全 基因 组 测序 工作 已 完成 ,使 得 一 些 物种 的 
CSP 家 族 基 因 被 陆续 鉴定 出 来 ,包括 西方 塞 蜂 Apis 
mellifera, Z fx Bombyx mori, W3 $ Camponotus 
japonicus 、 中 华 通 草 蛤 Chrysoperla sinica 2 JS X] vs 
Dendroctonus valens 等 昆虫 (Foret et al., 2007; Gong 
et al., 2007 ; Hojo et al., 2015; Li et al., 2015; Gu et 
al., 2015), P 4E fZ Ex Anopheles sinensis 是 中 国 记 
RR EAE dc Ze BO Ch , ER EER p HE P dg 
ET, dA 2€ 22 Up BJ HR EE AR Vo EE 
DX t5, 083 JA, rp fe Fit np 4p S ULT T HE C. A Jp 26 T8 8E 
(Chow, 1991; Zhang et al., 1994; Manguin et al., 
2010; Chang et al., 2014) 。 近 年 来 我 们 实验 室 开 
展 了 中 华 按 蚊 基因 组 和 转录 组 精细 测序 和 注释 ， 
refici: CSP 家 族 基 因 尚 未 有 研究 报道 。 本 研究 
鉴定 了 中 华 按 蚊 全 基因 组 上 的 CSP 家 族 基 因 ,分 
析 了 这 些 基 因 的 序列 和 功能 特征 ,在 基因 组 上 的 
XE Ji ZU RB UTER, RRRA ORAS Jc dE IH] CER 
R^. H BUE T DEA AOI AE VI AE AS f el te DR, 
Jy — 2b JT HR 9h ZI f ER B JR SZ Tb] UTE 2E 3S XE 
基础 。 


























1 材料 与 方法 


1.1 基因 序列 数据 库 

中 华 按 蚊 基 因 组 数据 和 转录 组 数据 (SRA 登录 
^5: SRA073189) 来 目 重 庆 师 范 大 学 昆虫 与 分 子 生 
物 学 研究 (Chen et al., 2014) ,其 他 物种 包括 冈比亚 
按 蚊 Anopheles gambiae | Y Kt. Aedes aegypti BUR 
Æ Culex quinquefasciatus 和 黑 腹 果 量 的 基因 组 数 
据 均 来 A F VectorBase 数据 库 ( https://www. 
vectorbase. org/ ) 。 
1.2 中 华 按 蚊 CSP 家 族 基因 在 全 基因 组 上 的 鉴定 
和 特征 分 析 

基于 发 表 的 家 人 到、 意大利 蜜蜂 Apis mellifera 
ligustica FUIR WA X Tribolium castaneum 等 的 CSP 
23 A e y YI] (Pelletier et al., 2011; Vieira and Rozas, 











2011) E NCBI 数据 库 中 下 载 CSP 家 族 基因 的 同 源 
序列 ,将 这 些 氨 其 酸 序列 作为 询问 序列 ,首先 用 
BLASTP 和 TBLASTN 搜索 中 华 按 蚁 氨 基 酸 和 基 
组 数据 库 (E<10”); 同 时 采用 HMM Pfam 号 
(pfam03392 ) 搜索 获得 一 个 新 的 CSP 家 族 基因 组 序 
列 。 将 所 有 获得 的 基因 组 CSP 序列 合并 去 除 重复 ， 
并 通过 FGENESH + ( http://linuxl. softberry. com/ ) 
在 线 软 件 对 提取 出 的 基因 组 序列 进行 预测 ,然后 将 预 
测 出 的 氨基 酸 序列 与 NCBI 的 GenBank 数据 库 进 行 
比 对 ,并 采用 SMART ( http ://smart. embl-heidelberg. 
de/ ) 软件 分 析 是 否 存 在 0S-D 结构 域 ,根据 其 结构 域 
H.E, 4] Zb Wü E LE y CSP 候选 基因 。 基 于 
VectorBase 和 NCBI 数据 库 的 基因 组 数据 ,用 同样 方 
法 鉴定 几 种 代表 性 双 翅 目 昆 虫 CSP 家 族 基因 。 
将 以 上 得 到 的 候选 CSP 家 族 基因 通过 ProtParam 
(http://www. expasy. org/ protparam/ ) „SignalP ( http:// 
www. cbs. dtu. dk/services/SignalP/ ) , TargetP ( http :// 
www. cbs. dtu. dk/services/TargetP/ ) , IMHMM ( http :// 
www. cbs. dtu. dk/services/? TMHMM/ ) 软件 对 其 蛋白 序 
列 分 子 式 、 分 子 量 、 等 电 点 、 信 号 肽 、 亚 细胞 定位 和 跨 
膜 区 等 进行 预测 分 析 。 
1.3 RhE CSP 家 族 基 因 在 基因 组 上 的 定位 
为 了 定位 中 华 按 蚊 CSP 家 族 基 因 ( 4sCSPs) 在 
全 基因 组 上 的 位 置 ,我 们 将 中 华 按 蚊 候选 CSP KIK 
AED B 2A REO FF INA TBLASTN 搜索 中 华 按 蚊 基 
因 组 数据 库 , 统 计 各 基因 在 基因 组 上 Scaffold 的 具 
WE. JEDE TESCO CSP 家 族 基 因 (4gCSPs ) 在 基 
因 组 上 的 位 置 数 据 下 载 于 VectorBase 数据 库 , 其 中 
AgCSP6 的 定位 参考 Iovinella 等 (2013) (基因 组 数 
据 为 Anopheles-gambiae-PEST_SCAFFOLDS_AgamP4 ) 。 
用 Photoshop CS8 绘制 AsCSPs 和 AgCSPs 基因 在 基 
因 组 上 的 位 置 图 。 
1.4 中 华 按 蚊 CSP 家 族 基因 的 转录 、 表 达 和 结构 分 析 
使 用 中 华 按 蚊 CSP 候选 基因 序列 搜索 中 华 按 
蚊 转 录 组 数据 库 (E<10”) ,检测 CSP 基因 是 否 存 
在 转录 本 ,并 获得 CSP 基因 家 族 成 员 对 应 的 FPKM 
( fragment per kb per million reads ) 值 ,以 此 佑 测 其 表 
达 量 。 
通过 Softberry 软件 和 中 华 按 蚁 CSP 家 族 基因 
的 转录 组 序列 预测 中 华 按 蚊 CSP 家 族 基因 的 结构 ， 
通过 在 线 软 件 GSDS( Gene Structure Display Server) 
( http ://gsds. cbi. pku. edu. en/index. php ) 预测 各 基 
内 含 子 相 位 (Hu et al., 2015) ,使 用 Photoshop CS3 
软件 绘制 各 基因 的 外 显 子 -内 含 子 结构 。 结 合 结构 
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预测 ,将 中 华 按 蚊 CSP 家 族 基 因 的 转录 组 序列 通过 
BLASTN 反比 到 对 应 基因 组 序列 上 ,确定 中 华 按 蚊 
CSP 家 族 基因 选择 性 的 剪 切 模式 。 
1.5 中 华 按 蚊 CSP 家 族 基 因 的 保守 结构 域 和 怎 白 
质 结构 分 析 

使 用 ClustalW 软件 对 中 华 按 蚊 CSP 家 族 氨基 
酸 序列 进行 多 重 序列 比 对 ,将 其 保存 为 Fasta 格式 
文件 ,再 导入 GeneDoc 软件 预测 其 保守 区 域 。 利 用 
在 线 软 件 PSIPREDv3. 3 ( http://bioinf. cs. ucl. ac. 
uk/psipred/ ) 预测 所 有 候选 CSP 家 族 基因 的 蛋白 质 
二 级 结构 ;采用 SWISS-MODEL ( http://swissmodel. 
expasy. org/ ) 进行 同 源 建 模 及 3D 结构 预测 分 析 ( 唐 
TSE, 2014; 刘 柏 琦 等 , 2016 ) 。 
1.6 双 翅 目 代 表 性 种 CSP 家 族 基因 的 系统 发 育 关 
系 分 析 

通过 软件 ClustalW 进行 氨基 酸 序 列 多 重 比 对 ， 
以 黑 腹 末 晶 CSP 氨基 酸 序列 为 外 群 ,采用 MEGAS. 0 
软件 使 用 最 大 似 然 法 (maximum likelihood, MI ) 
( Partial deletion 处 理 缺 失 数 据 , WAG + G 模型 ) 对 
中 华 按 蚊 PI EEE FRB .埃及 伊 蚊 和 致 倦 库 蚁 构建 系 
统 发 育 树 ,使 用 1 000 次 重复 计算 系统 发 育 树 上 的 
bootstrap [E ,将 大 于 5096 的 bootstrap 值 标 于 系统 发 
育 树 上 ,讨论 其 系统 发 育 关 系 。 





表 1 


1.7 ”中华 按 蚊 CSP 家 族 基 因 的 Ka/ Ks 分 析 

将 中 华 按 蚊 和 冈比亚 按 蚊 的 CSP 家 族 基 因 的 
和 蛋白质 编码 序列 (CDs) 的 终止 密码 子 去 除 , 采 用 
MEGAS. 0 对 每 个 中 华 按 蚊 CSP 家 族 CD 序列 与 内 
比 亚 按 蚊 的 直系 同 源 基因 CD 序列 分 别 进行 比 对 ， 
去 掉 gap 后 ,再 将 其 结果 用 PAML 软件 (Yang and 
Nielsen, 2000) 计算 非 同 义 替 换 率 (Ka) V e] UBER fa 
率 (Ks) 及 它们 的 比值 (Ka/Ks) ,分 析 中 华 按 蚊 CSP 
家 族 基因 在 进化 历史 中 的 选择 压力 和 选择 模式 。 





2 结果 
2.1 中 华 按 蚊 CSP 家 族 基因 在 全 基因 组 上 的 鉴定 
和 特征 分 析 

通过 在 中 华 按 蚊 全 基因 组 上 的 搜索 与 鉴定 , 获 
得 了 中 华 按 蚊 CSP 家 族 8 个 候选 基因 的 全 长 序列 。 
根据 它们 的 OS-D 结构 域 信息 及 其 在 基因 组 上 的 位 
置 ,分 别 将 其 命名 为 AsCSP1, AsCSP2, AsCSP3, 
AsCSPA , AsCSPS , AsCSP6 , AsCSP7 和 AsCSP8。 这 8 
个 基因 的 氨基 酸 序列 与 冈比亚 按 蚊 同 源 基 因 的 序列 
一 致 性 达到 67% ~ 9596, A XE 2 ZH 7y 116 
(AsCSP7) ~ 335 ( ASCSPS) 个 , 等 电 点 为 471 ~ 
9. 76 ,分 子 量 为 12.9 ~36.0 kD( 表 1)。 











中 华 按 蚊 CSP 家 族 基因 特征 及 其 与 冈比亚 按 蚊 CSP 基因 的 比较 


Table 1 Characteristics of CSP genes from Anopheles sinensis and the comparison with those in An. gambiae 


基因 全 长 氨基 酸 大 小 分 子 量 | 与 由 比 亚 按 蚊 同 源 基 因 比 对 | 
基因 名 称 基因 组 上 的 定位 ` s Molecular Comparison with homologous gene of An. gambiae 
Gene name Location on scaffold s pes Bingo acie que weight 基因 ID 号 — St ( 96 ) 
(B SE (kD) Gene ID Identity 
AsCSP1  Scaffold51 : 4 139 817 -4 140 197 381 126 14.7 AAL84186 83 
AsCSP2 . Scaffold51: 4 143 486 -4 143 869 384 127 14.7 XP. 317407 95 
AsCSP3  . Scaffold51: 4 155 411 -4 155 791 381 126 14.6 XP. 317405 9] 
AsCSPA . Scaffold51:; 4 158 635 -4 159 239 605 174 19.5 XP. 317404 67 
AsCSP5 ScaffoldS1. 4 182 389 -4 197 875 15 487 335 36 XP. 317401 85 
AsCSP6 . Scaffold51:; 4 213 890 -4 215 154 ] 265 123 14.2 CAG26923 90 
AsCSP7 . Scaffold51:; 4 238 749 -4 259 876 2] 128 116 12.9 XP. 317397 94 
AsCSP8 Scaffoldl16.:. 3 632 275 -3 637 193 4 919 129 14.7 AGF68546 81 
基因 名 称 分 子 式 SFE à C pl) 路 膜 区 杀 水 性 系数 不 稳定 指数 
Cene name Molecular formula Isoelectric point Transmembrane domain Hydrophobicity coefficient Instability index 
AsCSP1 C564 H 4944 N47; Q196 55 8.29 一 -0.587 34.34 
AsCSP2 Cess H1048 N 175 Q199 36 5.34 一 -0.554 34.77 
AsCSP3 Coas H1027 N175 Q198 Sq 8.26 一 -0.717 37.65 
AsCSP4 Cs38 H1329 N231 0579 511 4.71 一 -0.673 45.94 
AsCSP5 C1571 H2508 Nass 0501 S6 5.71 - - 0. 364 43.41 
AsCSP6 C627 H1042 N176 Q188 Sg 9.35 一 -0.698 25.48 
AsCSP7 C564 Ho37 N165 Q160 99 9.76 + 0.059 47.08 
AsCSP8 C09 Hoo N 173 Q182 S10 9.17 十 - 0.042 50. 65 


+: 有 Present; - : 没有 Absent. 
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对 这 8 个 AsCSPs By 4 AERA P] UETI Ze E EEG] 
和 特征 分 析 , 结 采 表 明 , ote e PU 4 个 保守 的 
AE E SAN f ( CYS68, CYS75, CYS94 和 CYS97 ) ， 
构成 两 个 二 硫 键 (CYS68-CYS75 和 CYS94-CYS97) , 
这 与 前 期 研究 的 化 学 感受 和 集 日 家 族 基 因 的 标志 性 特 
征 一 致 (图 1) ; N maA 17 ~37 个 氨基 酸 组 成 的 信 
号 肽 ; 亚 细 胞 定位 也 表明 这 8 个 基因 的 集 日 都 属于 
4] IU 16 *& H (secretory pathway signal peptide) ) , 可 
能 在 信号 物质 的 识别 和 传导 中 起 重要 作用 (Vieira 
and Rozas, 2011) 。AsCSP7 和 AsCSP8 的 OS-D 保守 
结构 域 具有 85 FAR, AsCSPI -6 的 OS-D 保守 
结构 域 长 93 个 氨基 酸 , 序 列 比 对 显示 这 个 区 域 高 度 
保守 和 一 致 。 所 有 这 些 化 学 感受 重 日 中 , 只 有 
AsCSP7 和 AsCSP8 具有 路 膜 区 。 亲 水 性 指数 分 析 
表明 , 除 AsCSP7 外 ,其 他 7 AE HAI D Rk TE 











日 ,推测 AsCSPs 家 族 可 能 是 一 个 可 溶性 噢 沉重 白 家 
族 ( 表 1, 图 1)。 
2.2 ”中华 按 蚊 CSP 家 族 基因 在 基因 组 上 的 定位 
将 中 华 按 蚊 CSP 家 族 基因 定位 到 基因 组 上 , 结 
果 表 明 AsCSP1 - AsCSP7 均 分 布 于 scaffoldsl E, 
AsCSPS8 分 布 于 Scaffoldll6 上 。 鉴 定 获 得 了 8 个 内 
比 亚 按 蚊 CSP 家 族 基因 ,将 这 些 基因 定位 到 内 比 亚 
按 蚊 基 因 组 上 ,发 现 AgCSP1 - AgCSP7 均 分 布 于 染 
色 体 3R E,AgCSPS 分 布 于 scf_1106392397089( 其 
染色 体位 置 尚未 定 ) 上 (图 2) 。 用 Photoshop CS8 $x 
Fd TL Hp e T SCRI DX] EE fi SC CSP 家 族 基 因 在 基 
因 组 上 的 相对 位 置 并 作 比 较 , 绪 采 显 示 , 除 了 CSPS 
以 外 ,其 余 7 个 CSP 家 族 基 因 均 成 族 分 布 于 同一 
Scaffold 或 染色 体 上 ,并 形成 一 一 对 应 关系 , 仅 CSP1 
和 CSP4 两 个 基因 的 序列 方 癌 不 一 致 (图 2) 。 





















* 20 * 40 60 * 80 * 100 
AsCSP1  ------------ VFIAF BLLDEGRÉTPD RILBDABO EK 77 
SP AE FKELMDEGRETPDENEBKK Q EK| 78 
AsCSP3 ------------ AL BLLDOGRÉTPD RILBDABO EK 78 
AsCSP4 | ------------ MBVMVLG--------SMADNEVERYDNINBEEZFNSS MNBEKNVGPBTPD DABMS EK 78 
AsCSP5  ---------- L WIL VD SRKPBPPE R RITKO 85 
ASCSPB — eene MKNLSIVAVIBMBVVL-——--——-- D LKGLLDK KTIBDABK EK 79 
AsCSP7  ----- MSSKALPNLFMLSAAVIBIBMAVL--—----—- | AA QRN PO 86 
AsCSP8  [MSGKVSSRSSSSSICWFIGVGLC TTTSHEQVSDEALBKABSDKRYLMROLRKSAEGEVEBDPVBKR A BA 100 

© © © © 

* 180 * 200 
AsCSP1 9 (^ le ————Ó 126 
AsCSP2 Re 127 
AsCSP3 * (2 Bre TERRE 126 
AsCSP4 DIEIDSVAHATEHKTAPSQDHDHGEGHTDESKN---- 174 
AsCSP5 GDNGNTVVENGGGNDRPVRNDLDRQPASQSSNVQAVV 185 
AsCSP6 ETSSI ARA CKS ----------EkrNR---------Rs------------------------------------- 123 
AsCsp7 AONO TEINOTRINE VM I RAV- —------------------------------------------------------------------- 116 
AsCSPB. [EEMNOAEBAHBOHBRREEETERUEEAG a 129 











图 1 中 华 按 蚊 CSP 家 族 基因 氨基 酸 序 列 的 多 重 比 对 和 特征 


Fig. 1 


Multiple sequence alignment and characteristics of amino acid sequences of CSP family in Anopheles sinensis 





AsCSP1 - AsCSP8 ; 中 华 按 蚊 化 学 感受 蛋白 家 族 基 因 Genes of CSP family in An. sinensis. F |E] The same below. 各 基因 编码 氮 基 酸 序列 N 端 信和 号 
肽 序列 标示 在 红色 框 内 ,0S-D 保守 结构 域 标示 在 黑色 框 内 ;100% , 80% ~99% , 60% ~79% 和 <60% 一 致 性 的 氨基 酸 序列 分 别 用 紫色 、 蓝 色 、 
2x C6 RU GbR 4 个 保守 的 半 胱 氮 酸 位 点 用 CC 标示 在 序列 下 方 ;AsCSP5 共 335 个 氮 基 酸 , 仅 显 示 到 第 185 位 氨基 酸 处 。The N-terminal signal 


peptides of each amino acid sequence are boxed in red, the OS-D conserved regions are boxed in black; purple, blue, green and orange shades denote the 





amino acid sequences with the identity of 10096 , 80% — 9996 , 6096 — 7996 and below 60% , respectively; the four characteristic cysteine sites are 


labeled with CC below the sequence; AsCSP5 is shown up to the 185th amino acid of 335 amino acids. 


scaffold 51 


scaffoldl 16 


32kb ,11.3 kb, 2.8 kb, 22.6 kb 18.1 kb 23.0 kb 
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3 2 S 3' 
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1.4kb , 9.7 kb , 1.9 kb 16.9 kb, 10.6 kb, 16.7 kb 
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An. gambiae —Mb———ádM)——9 — »—39» — ,—9—. 一 他 一 
5 3” AN 3’? 


AgCSP1 AgCSP2 AgCSP3 AgCSPA AgCSP5 AgCSP6 AgCSP7 


AgCSPS8 








图 2 中华 按 蚊 和 冈比亚 按 蚊 CSP 基因 在 基因 组 上 的 定位 
Fig. 2 Relative locations of the CSP genes in Anopheles sinensis and An. gambiae genomes 
AgCSPI - AgCSP8 ;. 站 比 亚 按 蚊 化 学 感受 重 白 家 族 基因 Genes of CSP family in An. gambiae. As [8] 5] 3 ES] FH] AI Te] BER, BI f az s S ZI E DA] 
序列 5' -3 方向 ,基因 间 的 距离 标示 在 基因 组 序列 的 横 线 上 方 。Different genes are marked with different colors of arrows with the arrow direction 


denoting 9 -3 "of the gene sequence, and the distance between genes are marked above the line demonstrating genomic sequence. 
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2.3 HÆR CSP 家 族 基 因 的 转录 、 表 达 和 结构 
对 中 华 按 蚊 的 转录 组 数据 库 搜索 表明 ,这 8 个 
CSP 家 族 基 因 均 具有 转录 本 ( 表 2)。4sCSP3， 
AsCSP4,AsCSP5 和 AsCSP7. 具有 1 个 转录 本 ， 
AsCSP2 ,AsCSP6 和 AsCSP8 具有 两 个 选择 性 转录 本 ， 
AsCSPl 具有 3 个 选择 性 转录 本 。 以 FPKM 值 估 测 
每 个 转录 本 的 表达 量 , 结果 显示 , Unigene871 _5 
( AsCSP3) 的 表达 丰 度 最 高 ,FPKM 值 达 385. 46, 其 
次 是 Unigene27178_5 ( AsCSP2) , CLI318. Contig3. 5 








( ASCSP1) FA CL1733. Contigl. 5 ( AsCSP6) ,其 FPKM 
值 分 别 为 71. 60,10. 25 和 9. 15; CLI318. Contigl. 5 
(AsCSP2) 的 表达 丰 度 最 低 ,FPKM [EIA 0.36, 
和 各 基因 不 同 转录 本 的 FPKM 值 ,4sCSP3 的 表达 丰 
度 最 高 (FPKM 值 为 385.46), 其 次 为 AsCSP2 
(71.96 ), AsCSP1 (17.13), AsCSP6 (12.68), 
AsCSPA (6. 23) ,AsCSP7 (5.98) , AsCSP8 (4.08) 和 


AsCSPS (2.73), 





R2 中 华 按 蚊 CSP 家 族 基因 的 选择 性 剪 切 及 转录 让 度 


Table 2 Splicing variants and transcription richness of genes of the CSP family in Anopheles sinensis 





基因 名 称 选择 性 剪 切 ID RFE 表达 丰 度 总 和 外 显 子 数量 
Gene name ID of splicing variants FPKM Total FPKM Exon number 
AsCSP1 CL1318. Contig2_5 5.46 17.13 1 
CL1318. Contig3_5 10.25 
CL1318. Contig4_5 1.42 
AsCSP2 Unigene27178. 5 71.60 71.96 1 
CL1318. Contigl_5 0.36 
AsCSP3 Unigene871 5 385.46 385.46 1 
AsCSP4 Unigene21154_5 6.23 6.23 2 
AsCSP5 CL1408. Contig4. 5 2.73 2.73 5 
AsCSP6 CL1733. Contigl. 5 9.15 12. 68 2 
CL1733. Contig2. 5 3.53 
AsCSPT Unigenel6775. 5 5.98 5.98 2 
AsCSP8 CL2094. Contigl. 5 3.27 4.077 3 
CL2094. Contig2. 5 0.81 





表达 丰 度 FPKM: 每 百 万 个 映射 的 读 取 序列 中 每 千 个 碱 基 的 外 显 子 的 序列 数 Number of fragments per kilobase of exon model per million mapped 


reads. 





基于 基因 组 和 转录 组 序列 ,通过 在 线 软件 CSDS 
绘制 了 AsCSPs 基因 结构 图 (图 3) , 结 采 显示 这 8 个 
基因 的 外 显 子 和 内 含 子 的 分 布 模式 差异 较 大 ， 
AsCSPl, AsCSP2 和 AsCSP3 仅 有 一 个 外 显 子 ， 
AsCSPA , AsCSP6 和 AsCSP7 有 两 个 外 显 子 ,AsCSP5 
和 AsCSP8 分 别 有 5 个 和 3 个 外 显 子 ( 表 2)。 仅 1 
个 内 含 子 相位 为 2 相位 ,其 余 都 为 1 相位 ,4sCSP5 ， 
AsCSP6 , AsCSP7 和 AsCSPS8 内 含 子 区 长 于 生日 质 编 
f px ,特别 AsCSP7 的 唯一 内 合子 长 度 达 20 782 bp, 
4] Wr F 4e F CSP 家 族 基 因 的 转录 本 发 现 ， 
AsCSP1l, AsCSP6 和 4sCSP8 的 选择 性 剪 切 由 5" vm fS 
同 长 度 的 UTR 所 造成 ,4sCSP2 B 3e te PES 7] p 3^ 
"ng As EKER UTR 所 造成 ,4sCSP4 和 AsCSP7 的 转 
录 本 在 5 985] Au] ^k 160 和 134 bp 的 氨基 酸 编码 
序列 (图 3)。 
2.4 中华 按 蚊 CSP 家 族 基 因 的 得 白质 结构 

根据 在 线 软件 PSIPRED 和 SWISS-MODEL 预测 
[f AsCSPs 和 便 日 的 空间 结构 ,结果 表明 , 除 AsCSP5 
外 的 7 个 AsCSPs 的 二 级 结构 都 是 由 6 个 a TE 














构 和 耻 链 串联 组 成 (图 4: A) ,这 是 昆虫 气味 结合 得 
日 二 级 结构 的 典型 特征 ,这 6 个 a 螺旋 构成 容纳 小 
分 子 的 跑 水 性 内 部 腔 , 性 信息 系 类 似 物 呈 芝 曲 状 态 
进入 其 中 (Sandler et al., 2000) 。 由 于 AsCSP5 C i 
^H 3r 200 个 氨基 酸 的 延伸 ,使 其 具有 7 个 oc BRIEM 
5 个 p 折 鳃 结构 ,前 面 的 6 个 a ERE RI ELSE FR Beza 
构 与 其 他 7 个 AsCSPs 相似 ,其 后 具有 1 个 a 螺旋 和 
5 个 B HERE 4: A)。 这 些 二 级 结构 的 异同 决 
定 了 这 些 基 因 的 相似 功能 及 其 理化 性 质 的 多 样 性 。 

由 于 AsCSP2 与 AgCSP2, 以 及 AsCSP7 与 
AgCSP7 氨基 酸 序 列 一 致 性 最 高 , 分别 为 95% 和 
94% ,所 以 将 AgCSP2 和 AgCSP7 作为 同 源 建 模 模 
版 ,预测 得 到 AsCSP2 和 AsCSP7 的 和 蛋白质 三 级 结构 
(图 4: B) ,结果 也 表明 AsCSP2 和 AsCSP7 都 由 多 个 
螺旋 、 延 长 链 及 回 折 结 构 组 成 ,其 螺旋 结构 比较 紧 
次, 界限 分 明 ,使 整个 重 日 质 分 子 呈 球状 ,构成 CSP 
的 各 个 a 螺旋 流动 性 很 强 , 使 CSP 具备 了 可 塑性 的 
结构 特点 , 目前 在 多 种 昆虫 的 CSP 中 已 得 到 证 实 
(Picimbon et al., 2000; Briand et al., 2002) 。 
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图 3 ”中华 按 蚊 CSP KEANE Y P e 3-339 R YeTETEBTU] 
Fig. 3 The intron-exon structure and splicing variants of CSP genes from Anopheles sinensis 
内 含 子 相 位 用 黑色 数字 标示 在 内 含 子 模 线 的 上 方 , 红 色 数 字 标 示 此 位 点 缺失 核 车 酸 的 长 度 ,下方 第 涉 和 方向 分 别 标示 各 转录 本 的 长 度 ( 核 车 酸 
数 标 于 箭头 线 中 部 ) 和 转录 方向 。Jntron phases marked with black numerals above the horizontal lines demonstrate the introns, red numbers indicate 
the lengths of the deleted nucleotides at the positions, and arrows and directions below the lines denote the length and transcription direction of the 


transcripts ( the nucleotide number is marked on the middle part of the arrow). 
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图 4 中华 按 蚊 CSP EAZA) 和 三 维 (B) 结 构 预 测 
Fig. 4 Predicted 2D (A) and 3D (B) structure of CSPs from Anopheles sinensis 
A: 二 维 结构 Two-dimensional structure. 每 条 序列 的 核 音 酸 位 点 用 刻度 斥 标注 ,a 螺旋 结构 和 B HA T 3 t LA ZT E M S EEE p DES The 


amino acid positions of each sequence are marked by a ruler, and the a-helix structure and B-sheet structure are labelled with red and yellow rectangle, 


respectively. B; AsCSP2 和 AsCSP7 的 三 维 结构 图 Three-dimensional structures of AsCSP2 and AsCSP7. 
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2.5 双 翅 目 代 表 性 种 CSP 家 族 基 因 的 系统 发 育 

鉴定 得 到 中 华 按 蚊 、 风 比 亚 按 蚊 埃及 伊 蚊 和 致 
倦 库 蚊 分 别 有 8, 8, 43 和 27 个 CSP 家 族 基 因 ,并 更 
正 了 AgCSP5 基因 的 序列 。 以 黑 腹 果 晶 CSP ARR 
序列 为 外 群 ,利用 MEGAS. 0 软件 通过 最 大 似 然 法 
对 双 对 目的 4 个 蚊 科 种 和 1 个 果 晶 科 种 的 CSP 家 族 
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基因 构建 了 系统 发 育 树 (图 5)。 结 果 显 示 , 在 4 种 
蚊虫 中 都 存在 1:1 的 直系 同 源 基 因 , 且 形成 较为 分 
明 的 8 个 组 (CSP1 - CSP8 group) ,部 具有 很 好 的 目 
展 值 支 持 (bootstrap 7y 5196 ~100% )( 图 5: A), P 
EFE A px Eb E. Fk SCZR ZI OS AR de Xr. AgCSPs 和 
AsCSPs 的 每 个 基因 都 分 别 对 应 地 聚 类 在 一 个 分 文 
上 ,上 且 其 目 展 值 为 76% ~100% ,这 些 基 因 在 基因 组 
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图 5 代表 性 双 翅 上 日 昆虫 基于 氨基 酸 序列 的 CSP 家 族 基因 的 系统 发 育 关 系 ( 最 大 似 然 法 ) 


Fig. 5 Phylogenetic relationships of the CSP gene family in representative Diptera insects based 


on the deduced amino acid sequences ( maximum likelihood method ) 
As; PEREX Anopheles sinensis; Ag: 办 比 亚 按 蚊 Anopheles gambiae; Aa; Eg X px Aedes aegypti; Cq: MPE Culex quinquefasciatus; Dm; 黑 腹 
果 晶 Drosophila melanogaster. A; WHAM 4 种 蚊虫 CSP 家 族 基 因 的 系统 发 育 关系 ,其 中 库 蚊 亚 科 特 异 扩张 的 Culicinae-specific 组 以 黑色 三 角 标 示 
1 EE EC ot D. melanogaster four masgdito species, and 0 TT i down as back tanle; B: 
库 蚊 亚 科 特异 扩张 的 Culicinae-specific 组 内 基因 系统 发 育 关系 Phylogenetic relationships of the genes in the Culicinae-specific group. 大 于 50% 的 
bootstrap 值 标记 在 树 的 分 文 节 点 上 ;标尺 代表 系统 遗传 距离 。Percentage bootstrap values higher than 5096 are marked on each branch, and the scale 


bar indicates the genetic distance. 
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上 的 分 布 及 系统 发 育 分 析 表 明 CSP 家 族 基因 在 这 
两 个 按 蚊 的 进化 中 是 相对 保守 的 ,彼此 具有 1:1 的 
直系 同 源 关 系 ,起 源 于 这 两 个 种 的 共同 祖先 。 在 
CSP4, CSP6 和 CSP7 组 中 ,各 有 一 个 黑 腹 果 蝇 的 
CSP 家 族 基 因 (DmrCSP4，DmCSP3 DmCSP1 ) , 而 
CSP5 和 CSP8 2H rp Z IRE IRSE CSP 同 源 基因 。 
重要 的 是 , 黑 腹 采 蝇 的 DmCSP2 似乎 和 其 他 组 的 复 
合体 (CSP1，CSP2，CSP3 和 Culicinae-specific 
eroup) 形成 了 一 个 姊妹 群 。 这 个 Culicinae-specific 
组 的 基因 为 库 蚊 亚 科 所 特有 (图 5$: B), HEAR 68% 
的 bootstrap 值 支持 。 在 所 人 研究 的 埃及 伊 蚊 和 致 伴 库 
蚊 中 的 基因 数 远 多 于 这 两 个 种 的 其 他 CSP 组 
(CSP1 - CSP8 group) 基因 的 总 和 ,分 别 有 35 个 基因 
(总 共 43 个 基因 ) 和 18 个 基因 (总 共 27 个 基因 ) 


























(图 $: B)。 致 倦 库 蚊 经 历 了 一 个 基因 的 重复 事件 
分 化 成 2 个 CSP1 基因 (CgCSP23 和 CoCSP24) 。 
2.6 ”中华 按 蚊 CSP 家 族 基 因 的 非 同 义 蔡 换 

基因 氨 基 酸 编码 区 的 核 甘酸 在 进化 过 程 中 具有 
不 同 的 蔡 代 速率 ,通常 可 利用 非 同 义 蔡 换 率 与 同 义 
替换 率 的 比值 (Ka/Ks) 来 检验 编码 序列 所 经 历 的 目 
然 选 择 压 力 ( 周 琦 和 王 文 , 2004) 。 我 们 选择 中 华 按 
蚊 与 四 比 亚 按 蚊 的 直系 同 源 基因 对 计算 其 Ka/Ks 
比值 ,从 数据 结果 可 发 现 ,这 些 基 因 对 的 Ka/ Ks fH 
都 小 于 1, 介 于 0.0131~0.2976 之 间 ( 表 3) ,说明 
CSP 基因 家 族 在 进化 过 程 中 主要 是 受到 纯化 选择 作 
用 。 其 中 ,CSP4 和 CSPS 的 Ka/Ks 值 相 对 较 高 ,分 
别 为 0.2267 和 0. 2976 ,表明 这 两 个 基因 所 经 受 的 
选择 压力 更 小 。 











RI rej ELS CSP 直系 同 源 基因 对 的 Ka/Ks 分 析 


Table 3 Ka/Ks analysis for the orthologous CSP gene pairs between Anopheles sinensis and An. gambiae 


CSP 直系 同 源 基因 对 Ka 
Orthologous CSP gene pairs 
AsCSPI-AgCSPI 0.0914 
AsCSP2-AgCSP2 0.0229 
AsCSP3-AgCSP3 0.0447 
AsCSPA-AgCSPA 0.2245 
AsCSP5-AgCSP5 0. 2667 
AsCSP6-AgCSP6 0. 0389 
AsCSPT-AgCSPT 0. 0241 
AsCSP8-AgCSP8 0. 1193 


Ks Ka/Ks 
2.7835 0. 0328 
0. 6277 0. 0364 
0.4616 0. 0969 
0. 9905 0. 2267 
0. 8961 0. 2976 
2.9658 0.0131 
0. 3917 0.0616 
1.2191 0.0979 


Ka: 非 同 义 蔡 换 率 Non-synonymous substitution rate; Ks: 同 义 替换 率 Synonymous substitution rate. Ka/Ks > 1, 正 选 择 Positive selection; Ka/Ks = 
1 ， 中 性 选择 Neutral selection; Ka/Ks <1, 纯化 选择 Purifying selection. 


3 讨论 


化 学 感受 生日 CSP 在 昆虫 感受 外 界 信息 素 的 
过 程 中 扮演 痢 重 要 的 角色 。 这 类 和 集 日 在 不 同 物 种 的 
数量 差异 很 大 ,已 知 在 内 比 亚 按 蚊 、 黑 腹 采 蝎 KR, 
RMANA .意大利 蜜蜂 MAMARA 8, 4, 
19, 19, 6, 10 和 6 个 CSP 家 族 编码 基因 (Vieira and 
Rozas, 2011) ,表明 不 同 适 应 性 昆虫 感受 外 界 信 息 
的 分 子 机 制 存 在 相应 差异 。 本 研究 在 中 华 按 蚊 全 基 
因 组 水 平 上 鉴定 得 到 8 个 CSP 家 族 基 因 , rp feux 
气味 分 子 结合 集 日 OBP 家 族 有 64 个 基因 (He et 
al., 2016) ,进一步 表明 昆虫 CSP 基因 数 少 于 OBP 
基因 数 (Vieira and Rozas, 2011) 。CSP sx XE MJY YI 
比 OBP 在 不 同 物种 中 更 保守 ,CSP 比 OBP 的 起 源 更 
H ( Sanchez-Gracia et al., 2009), CSP 类 似 和 蛋白 广 
ZAE T B 3099 "hn, 4H Xe EF HE 271] P A P 














( Vieira and Rozas, 2011) ,CSP 被 认为 是 生物 识别 
环境 化 学 分 子 刺 激 的 主要 古老 机 制 , 随 看 目 然 选择 
压力 的 减 小 ,高 等 动物 中 相应 功能 已 逐渐 被 专 化 性 
更 高 的 OBP 和 PBP 家 族 基 因 所 取代 ( 徐 浩 镶 等 ， 
2015) 。 在 OBP 存在 的 情况 下 , CSP 仍 普遍 存在 于 
ERAF, 这 表明 CSP 仍 执行 非常 重要 的 生理 
功能 。 

中 华 按 蚊 的 8 个 AsCSPs 具有 很 高 的 保守 性 ,其 
OS-D 保守 结构 域 为 85 或 93 TAER, 4 NFA 
酸 构 成 两 个 二 硫 键 ( CYS68-CYS75, CYS94- 
CYS97)。 其 重 白 结构 分 析 发 现 ,所 有 AsCSPs 均 有 
6 个 a 螺旋 ,这 个 结构 在 其 他 物种 中 也 普 裔 存在 ,也 
意味 着 这 些 基 因 的 功能 保守 性 。 对 转录 组 数据 分 析 
表明 ,这 些 AsCSPs 基因 均 存在 转录 表达 ,AsCSP3 的 
表达 量 最 高 , FPKM 值 达到 385.46, AsCSP2, 
AsCSP6 和 AsCSP8 具有 两 个 选择 性 关切,AsCSP1 H. 
有 3 4 ETETEBTT], 
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本 研究 新 鉴定 了 埃及 伊 归 和 致 倦 库 蚊 ,再 次 鉴 
定 了 冈比亚 按 蚊 全 基因 组 上 的 CSP 家 族 基 因 , 和 中 
华 按 私 及 黑 腹 果 蝇 一 起 研究 了 这 些 种 的 CSP 家 族 
基因 的 系统 发 育 。 由 于 4 种 蚊虫 中 的 8 个 CSP 基因 
都 存在 1: 1 的 直系 同 源 基因 并 形成 明显 不 同 的 文 
系 ,本 人 研究 把 它们 分 为 8 个 不 同 的 组 (CSP1 - CSPS 
group) 。 在 CSP4 CSP6 和 CSP7 组 中 各 存在 一 个 黑 
腹 采 蝇 的 CSP 基因 ,表明 这 些 组 的 基因 起 源 于 蚊虫 
和 果 蝇 分 化 之 前 ,而 CSPS 和 CSP8 组 中 缺乏 黑 腹 果 
hE CSP 同 源 基因 ,表明 这 两 个 组 起 源 于 蚊虫 和 采 量 
分 化 之 后 。 黑 腹 采 量 的 DmCSP2 和 其 他 组 的 复合 
体 (CSP1 ，CSP2 CSP3 和 Culicinae-specific group ) 
是 姊妹 群 , 这 个 复合 体 的 基因 很 可 能 是 蚊虫 在 进化 
过 程 中 为 适应 环境 而 大 量 扩 增产 生 的 。 挨 及 伊 蚊 和 
致 倦 库 蚊 分 别 有 35 个 基因 和 18 个 基因 形成 了 一 个 
特殊 的 支 系 , 不 为 按 败 所 共有 ,本 人 研究 将 这 个 特有 文 
系 命 名 为 Culicinae-specific 组 ,这 是 库 蚊 亚 科 昆虫 
CSP 家 族 基 因 的 特异 性 扩张 ,反映 了 该 亚 科 特有 的 
进化 和 功能 。 这 个 Culicinae-specific 2H I] 3 KAF tr 
基因 数 (35 个 基因 ) B] 3 TEE SC RE DSTICC 18 
个 基因 ) ,这 反映 了 库 蚊 亚 科 种 间 的 差异 。 

目 然 界 中 发 生 的 很 多 非 同 义 突变 都 是 有 害 突 
AF ,在 净化 选择 的 作用 下 这 些 位 点 的 碱 基 蔡 换 率 比 
较 低 。Ka/Ks 值 越 小 ,表明 该 基因 承受 的 选择 压力 
越 大 ,保守 程度 越 高 。 右 Ka/Ks 值 < 1, X Ie] CES 
换 的 速率 高 于 非 同 义 符 换 的 速率 ,否则 认为 有 纯化 
选择 的 压力 ( 周 琦 和 王 文 , 2004) 。 我 们 的 研究 表明 
所 有 中 华 按 蚊 与 冈比亚 按 蚊 同 源 基因 对 的 Ka/ Ks 
值 都 小 于 1, 这 在 一 定 程度 上 也 说 明 昆 虫 基因 组 中 
CSP 基因 家 族 的 进化 相对 绥 慢 且 部 度 保 守 , 从 某 种 
程度 上 也 反映 出 这 些 化 学 感受 重 日 在 昆虫 的 生存 中 
发 挥 看 不 可 或 缺 的 作用 。 

CSP 基因 在 昆虫 触角 、 嗓 、 下 展 须 和 足 等 各 化 学 
感 顶 中 具有 大 量 表达 ,担负 着 感受. 识别 和 转运 环境 
中 化 学 刺激 信息 的 功能 。 大 量 的 研究 也 表明 ,这 类 
重 白 在 性 腺 KE 腹部 等 没有 任何 化 学 感受 结构 的 
组 织带 官 中 表达 (Jacquin-Joly et al., 2001) ,推断 
CSP 在 昆虫 的 生命 活动 中 还 参与 许多 其 他 重要 的 生 
理 功 能 ,如 日 本 号 背 蚁 Camponotus japionicus CSP 可 
浴 解 表皮 磷 氧 类 化 合 物 ,从 而 识别 不 同 虽 六 蚁 群 ,并 
产生 排 异性 ( Ozaki et al., 2005) ;蜜蜂 和 云 杉 色 卷 峨 
Choristoneura fumiferana CSP TE Wi Bz Bij BH BJ ge sg HH 
A reg FAMAE W Sz BH EA] de 3s Ft CE S HL Eis rh 
di Hz X: (Wanner et al., 2005; Maleszka et al., 






















































































2007); 通过 RNA 干扰 试验 证 实 , AH 56 A oA 
Spodoptera exigua CSP fE T. £ [AE IK Hz p^ DN AN BB EA] HRS 
化 能 力 ( Gong et al., 2012), 

本 人 研究 基于 生物 信息 学 分 析 在 全 基因 组 水 平 鉴 
定 了 中 华 按 蚊 CSP 家 族 基 因 , 分 析 了 它们 的 特征 ， 
通过 比较 基因 组 分 析 讨 论 了 这 个 家 族 基 因 在 蚊 科 昆 
虫 的 进化 ,建立 了 新 的 分 类 系统 ,为 后 续 开 展 CSP 
家 族 基因 在 感受 外 界 信息 及 其 他 生理 活动 上 的 功能 
更 定 了 基础 。 
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